其他
美团基于知识图谱的剧本杀标准化建设与实践
The following article is from 美团技术团队 Author 李翔 陈焕 志华等
剧本杀作为爆发式增长的新兴业务,在商家上单、用户选购、供需匹配等方面存在不足,供给标准化能为用户、商家、平台三方创造价值,助力业务增长。
本文介绍了美团到店综合业务数据团队从0到1快速建设剧本杀供给标准化的过程及算法方案。我们将美团到店综合知识图谱(GENE,GEneral NEeds net)覆盖至剧本杀行业,构建剧本杀知识图谱,实现供给标准化建设,包括剧本杀供给挖掘、标准剧本库构建、供给与标准剧本关联等环节,并在多个场景进行应用落地,希望给大家带来一些帮助或启发。
一、背景
二、解决方案
三、实现方法
3.1 剧本杀供给挖掘
3.2 标准剧本库构建
3.3 供给与标准剧本关联
四、应用实践
4.1 类目构建
4.2 个性化推荐
4.3 信息外露和筛选
4.4 评分和榜单
五、总结展望
参考文献
作者简介
招聘信息
平台类目缺失:平台缺少专门的“剧本杀”类目,中心化流量入口的缺失,导致用户决策路径混乱,难以建立统一的用户认知。 用户决策效率低:剧本杀的核心是剧本,由于缺乏标准的剧本库,也未建立标准剧本和供给的关联关系,导致剧本信息展示和供给管理的规范化程度低,影响了用户对剧本选择决策的效率。 商品上架繁琐:商品信息需要商户人工一一录入,没有可用的标准模板用以信息预填,导致商户在平台上架的剧本比例偏低,上架效率存在较大的提升空间。
二、解决方案
三、实现方法
3.1 剧本杀供给挖掘
无监督匹配:首先构造剧本杀相关的关键词词库,分别在商户名、商品名及商品详情、商户UGC三个来源的文本语料中进行精确匹配,并构建基于BERT[1]的通用语义漂移判别模型进行匹配结果过滤。最后,根据业务规则基于各来源的匹配结果计算相应的匹配分数。 有监督拟合:为了量化不同来源匹配分数对最终判别结果的影响,由运营先人工标注少量商户分数,用以表征商户提供剧本杀服务的强弱。在此基础上,我们构造了一个线性回归模型,拟合标注的商户分数,获取各来源的权重,从而实现对剧本杀商户的精准挖掘。
3.2 标准剧本库构建
3.2.1 标准剧本名称的挖掘
文本编码器:使用文本预训练模型BERT[1]作为文本编码器,将输出平均池化后作为文本的向量表示。 图像编码器:使用图像预训练模型EfficientNet[4]作为图像编码器,提取网络最后一层输出作为图像的向量表示。
3.2.2 标准剧本属性的挖掘
3.3 供给与标准剧本关联
3.3.1 商品关联
3.3.2 内容关联
四、应用实践
4.1 类目构建
4.2 个性化推荐
4.3 信息外露和筛选
4.4 评分和榜单
五、总结展望
标准剧本库的持续完善:优化标准剧本名称和属性以及相应的供给关联关系,保证标准剧本库的质与量俱佳,并尝试引入外部的知识补充当前的标准化结果。 剧本杀场景化:当前剧本杀知识图谱主要以“剧本”这类用户的具象需求对象为主,后续将深入挖掘用户的场景化需求,探索剧本杀和其他行业的联动,更好的助力剧本杀行业的发展。 更多的应用探索:将图谱数据应用于搜索等模块,在更多的应用场景中提升供给匹配效率,从而创造出更大的价值。
参考文献
作者简介
2021-11-05
2021-11-05
2021-11-04
2021-11-03
2021-11-03
2021-11-02
2021-11-01
2021-11-01